Atención de rama específica por clase en desequilibrio Descubre cómo la atención de rama reduce la interferencia de gradiente, mejorando el F1 de clases minoritarias de 0.261 a 0.522 en desequilibrio severo. 2026-06-06 · 2 min